NEJM：临床研究统计分析的要求和报告规范

Original 唐金陵译临床研究与循证医学

2024-11-28

1）总体要求

所有稿件都应在“方法部分”，简单描述主要分析和次要分析的内容，以及样本量和统计功效。

所有稿件都应在“方法部分”，交代缺失数据的处理方法。除非缺失非常罕见，否则，所谓“包括所有病例”的分析是不可能的，所以是不可接受的，研究者应该根据数据缺失的原因或机制采取适当的处理方法。

比如，对于随机缺失的数据，可采用多重填补法（multiple imputation）或逆向概率加权法（inverse probability case weights）；如果缺失数据不是随机的，且有一定的规律性，可采用基于模型的填补方法。本杂志关于临床试验缺失数据处理的一般原则，可参见2012年本刊发表的Wareet及同事的方法学文章 (N Engl J Med 2012; 367: 1353–1354)。

论文在提供统计学检验P值的同时，还必须提供有关效应值、关联强度或其它结果指标的可信区间。可信区间不应局限于95%，而是应根据调整过的一类错误值的大小做相应的调整。[比如，多重比较时可能选用0.001作为一类错误值，那么可信区间就应该根据0.001来计算。——译者注]

除非研究问题和研究设计特别要求单侧统计学检验，如非劣效性临床试验，那么所有研究都应提供双侧检验的P值。一般情况下，P值大于0.01时，其数值只需保留小数点后两位；如果在0.01到0.001之间，其数值只需保留小数点后三位；如果小于0.001，则统一用P<0.001表达。当然，有些场合也需要变通，比如预先设有中止条件的临床试验，或是全基因组的关联性研究。

对结果的报告不需超过一个特定样本量的研究可提供的科学上的或临床实践所需要的精度。比如，对于测量关联的OR（odds ratio，比值比）的报告，小数点后一般保留两位即可，例如OR=2.18。对于模型分析的结果，如回归分析中的回归系数，小数点后保留合理的位数即可，不可过多。

2）对临床试验的特殊要求

投稿时，应同时递交最初和最终的研究设计方案、相应的统计分析计划（statistical analysis plans, SAPs），以及在研究实施过程中对研究设计方案和统计分析计划调整的清单，包括调整的内容和日期。

除特殊情况外，临床试验对主要结局的分析一般都应与最初计划的分析方案保持一致。如果二者不一致，应在稿件的方法部分中说明理由。此外，有时杂志可能会要求作者进行一些研究最初计划外的统计分析。

在确认性分析中，当进行多组比较时，研究者应该遵守研究方案和统计分析预先计划的程序，以控制一类错误。比如，具体可采用邦费罗尼校正法（Bonferroni adjustments）或事先制定的[按照比较的重要性排序的]序贯比较法（hierarchcal testing procedures）。多重比较的P值应在文章中如此标明。如果采用序贯比较法，只需报告最后一个有统计学意义的及其之前的P值，无需报道第一个没有统计学意义的及其之后的所有P值。对于预选设定的探索性分析，研究者应该按照统计分析方案预先规定的方法来控制假阳性错误出现的概率，例如Benjamini–Hochberg法。

如果临床试验统计分析计划中没有写明多重比较时采用哪种方法来控制一类错误，即没有说明如何控制假阳性结果出现的概率，那么针对所有次要和探索性结局的分析，只需报告治疗效果的点估计及其95%置信区间，无需报告相应的P值。在这种情况下，文章的“方法部分”应注明，可信区间的宽度没有做多重比较的调整，不能保证结论的外推性。

有关细节可参考Wang和同事推荐的亚组分析方法 (N Engl J Med 2007; 357: 2189–2194) 。如果一个亚组分析是统计分析方案中预先计划好的，那么有关分析就必须按照预先规定的方法进行。如果研究者事后认为一项没有预先计划的亚组分析是重要的，那么必须给出合理的解释。而且，文章必须标明那些事后分析的结果。

森林图常用来展示亚组间干预效果一致性（或异质性）的情况，对于呈现不同亚组的效果非常有用，我们建议研究报告应包括所有重要亚组分析的森林图（参见下图）。但是，如果亚组样本量比较小，对组间结果一致性的推论就不可靠了。另外，多种变量与治疗间交互作用一一分析的P值，存在多重比较的问题，推论价值有限，一般都不用报告。

在报告治疗结果的同时，对于不属于主要结局的安全性结局（即关于副作用和不良反应的结局）的分析，不需要对其P值进行多重比较的调整。因为不同的安全性结局反映的是治疗对不同器官系统的损伤，彼此是相互独立的，所以我们认为，一类错误大于0.05甚至也是可以接受的。因此，我们要求对不同组间安全性结局频率的比较，都提供相应的P值，无论他们是否预先计划的比较。

如有可能，在呈现HR（hazard ratio）或RR（relative rate）之前，作者应对结局的绝对和相对频率进行描述，目的是使读者能了解事件发生的绝对和相对频率。应避免使用OR，因为很多情况下OR会高估RR，造成误解。

作者需要按照CONSORT声明的要求，提供一张受试者流程图（参考下图）。同时，我们也鼓励作者递交CONSORT声明清单里要求的所有有关的信息。尽管这些信息可能不完全被发表，但作者在投稿时需在稿件正文或补充材料的附件里提供它们。CONSORT声明、要求的内容清单，以及受试者流程图模板，均可以在CONSORT网站（或下面提供的EQUATOR Network网站）获取。

3）对观察性研究的特殊要求

观察性研究结果的可靠性取决于几个重要的假设，其中包括研究对象的选择、被测量和没被测量的混杂，以及控制混杂方法的有效性。文章的“方法部分”须描述研究的设计和分析是如何具体处理这些以及其他有关问题的。

如果一个观察性研究事先制定了（包括要进行哪些假设检验的）统计分析方案，作者应签字、注明日期，并在投稿时与文章一并递交。我们鼓励作者将观察性研究的统计分析计划存放在为此设置的在线存储平台上。

进行多重比较的观察性研究，应采用事先设定好的、可接受的方法来控制family-wise error rate，即假阳性结果出现的概率。对于没有预先校正计划的多重比较，只需报告有关结果的点估计值及其95%可信区间，无需报告有关P值。而且，在“方法部分”应注明，没有对可信区间进行多重比较校正，不能保证它们的外推性。

如果不能提供事先制定的分析计划，作者应在“方法部分”对预先制定的分析计划做一个概括性的描述，具体内容应包括：研究对象的合格标准和抽样方法，最好加上一个研究对象的流程图（参见下图）；欲测量的关联关系或因果作用，以及选择分析它们的理由；事先确定的针对治疗或暴露效应推论的统计学方法。

报告治疗或暴露效应的研究，应按照暴露或治疗因素进行分组，描述各组混杂因素和其他有关因素的分布（参见下图）。当分析须控制组间混杂因素时，应报告混杂因素组间区别的点估计值及其95%可信区间。

对于复杂的统计模型及其诊断结果的描述，一般可放在补充材料的附件中。我们鼓励作者进行敏感性分析，分析未控制的混杂因素对结果可能产生的影响。如果没有进行敏感性分析，作者则须在文章的讨论部分，针对没有控制的混杂因素，分析它们对结果可能产生的偏倚。

我们也鼓励作者利用独立的类似的研究重复目前研究的发现，以评估结果的稳定性。

原文链接（或点击文尾“阅读原文”）

https://www.nejm.org/author-center/new-manuscripts

4. 其他重要信息

关于各种临床研究设计类型的论文写作规范，请访问

Equator Network (Enhancing the QUAlity and Transparency Of health Research) at：

https://www.equator-network.org/

翻译：唐金陵，英国医学杂志（BMJ）高级临床研究编辑，广州市妇女儿童医疗中心临床研究总监，北京大学循证医学中心主任，中科院深圳理工大学讲席教授，香港中文大学流行病学荣休教授。2021.9.6

5. 扩展阅读

唐金陵教授《流行病学和临床研究方法学文集》 | 2021-03-16

长按上方二维码关注我们

修改于

继续滑动看下一个

临床研究与循证医学

向上滑动看下一个

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

中国紫砂博物馆出品！2025紫砂五福杯：五福云集，掌上藏品，宜藏宜礼！

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

NEJM：临床研究统计分析的要求和报告规范

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

中国紫砂博物馆出品！2025紫砂五福杯：五福云集，掌上藏品，宜藏宜礼！

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

生成图片，分享到微信朋友圈

NEJM：临床研究统计分析的要求和报告规范

您可能也对以下帖子感兴趣